快讯列表

关于 LLM 异常 的快讯列表

时间 详情
2025-10-09
00:10
安德烈·卡帕西批评RLHF:LLM畏惧异常,呼吁在RL训练中重设奖励机制

根据安德烈·卡帕西在2025年10月9日于Twitter发布的信息,他指出当前强化学习实践让LLM对异常产生过度恐惧,并强调异常是健康开发流程的正常组成部分。卡帕西号召签署其“LLM福利请愿”,以在出现异常时给予更合理的奖励设计。该帖未提及任何加密资产、代币或市场数据,来源未提供直接的市场更新。

来源